Google Gemini lidera los juegos sociales de IA en la Game Arena de DeepMind

Categoría: Análisis

Senior AI Research Analyst

04 Febrero 2026

Listen On

Los modelos Gemini de Google obtienen los mejores resultados en juegos de mesa sociales. Google DeepMind, en colaboración con Kaggle, amplió la plataforma “Game Arena” con dos nuevos juegos: Hombre Lobo y Póker. La plataforma evalúa modelos de IA en juegos estratégicos: el ajedrez mide el razonamiento lógico, Hombre Lobo pone a prueba habilidades sociales como la comunicación y la detección del engaño, y el póker evalúa la gestión del riesgo y la toma de decisiones con información incompleta.

Según el planteamiento del benchmark, estos juegos permiten mediciones más objetivas de capacidades como planificación y decisiones bajo incertidumbre. En las clasificaciones actuales, Gemini 3 Pro y Gemini 3 Flash ocupan los primeros puestos en todas las tablas. Además, el benchmark de Hombre Lobo también se utiliza para investigación de seguridad: sirve para comprobar si los modelos pueden reconocer intentos de manipulación sin exponerlos a riesgos reales. De acuerdo con el CEO de Google DeepMind, Demis Hassabis, la industria necesita pruebas más exigentes para evaluar los modelos más recientes.

Javier Morales

Senior AI Research Analyst

Javier Morales es investigador y analista senior en inteligencia artificial con base en España. Su trabajo se centra en el estudio de modelos de IA a gran escala, su integración en infraestructuras empresariales y las implicaciones económicas y sociales de su adopción. Ha analizado en profundidad las estrategias de las principales compañías tecnológicas, así como el impacto de la inteligencia artificial en productividad, gobernanza digital y comportamiento de los usuarios. Sus publicaciones se caracterizan por un enfoque analítico, basado en datos y orientado a la evaluación crítica de tecnologías emergentes.

Google Gemini lidera los juegos sociales de IA en la Game Arena de DeepMind

Podcast by Javier Morales

OpenAI busca alternativas a los chips de Nvidia por problemas de velocidad en la inferencia

Cipher Mining y TeraWulf aceleran su giro hacia HPC e IA con nuevas inversiones en centros de datos